附录
设置联系地址和脚本名称
EDirect自动从系统获取用户的电子邮件地址,以便有人在失控脚本导致Entrez服务器出现问题时通知,但是如果需要其他联系地址(例如,系统管理员或软件开发人员)可以在管道或脚本的开头显式设置:
|
|
这样,如果脚本中的无限循环意外滥用NCBI资源,NCBI就会有关于联系人的信息。 (为方便起见,还可以在所有电子实用程序调用操作中设置首选电子邮件地址和软件工具名称。)
命令行参数
下面列出了EDirect功能的参数:
使用esearch在索引条款上开始新的Entrez搜索:
查询规范
|
|
文件订单
|
|
日期
|
|
按现场限制
|
|
拼写检查
|
|
杂项参数
|
|
elink函数查找相关文章或相关记录:
目标数据库
|
|
直接记录选择
|
|
高级控制
|
|
批量处理
|
|
杂项参数
|
|
使用efilter通过索引术语限制搜索或链接结果:
查询规范
|
|
文件订单
|
|
日期
|
|
按现场限制
|
|
拼写检查
|
|
出版过滤器
|
|
序列过滤器
|
|
基因过滤器
SNP过滤器
|
|
杂项参数
|
|
记录检索功能是efetch:
格式选择
|
|
直接记录选择
|
|
序列范围
|
|
基因范围
|
|
序列标志
|
|
杂
|
|
xtract函数用于处理XML数据:
处理标志
|
|
数据源
|
|
探索参数层次结构
|
|
勘探建筑
|
|
条件执行
|
|
字符串约束
|
|
数字约束
|
|
格式定制
|
|
元素选择
|
|
-element Constructs
|
|
特殊元素操作
|
|
数字处理
|
|
字符串处理
|
|
文字处理
|
|
序列处理
|
|
序列坐标
|
|
命令生成器
|
|
-insd参数顺序
|
|
杂
|
|
重新格式化
|
|
修改
|
|
验证
|
|
摘要
|
|
文档
|
|
einfo函数返回有关Entrez索引字段的信息:
数据库选择
|
|
数据摘要
|
|
EDirect提供了几个附加功能:
epost
|
|
eproxy
|
|
econtact
|
|
nquire
|
|
此外,-email和-tool在所有E-utilities调用函数中都可用于覆盖默认值,-http get将强制使用GET而不是POST,-alias将指定快捷键关键字和查询字符串或URL的文件sections和-help将打印每个函数的参数列表。
对于调试,-silent将禁止链接失败重试消息,-verbose将在每一步显示
EFetch格式
每个数据库的EFetch -format和-mode值如下所示:
ESearch排序
下面列出了几个数据库的ESearch -sort值:
ELink命令
ELink -cmd选项生成结果为LinkSet XML:
-cmd | Result |
---|---|
neighbor | Neighbors or links |
neighbor_score | Neighbors with computed similarity scores |
acheck | All links available |
ncheck | Existence of neighbors |
lcheck | Existence of external links (LinkOuts) |
llinks | Non-library LinkOut providers |
llinkslib | All LinkOut providers |
prlinks | Primary LinkOut provider,or URL for single UID with -mode ref |
EInfo数据
EInfo字段数据包含多个术语列表索引属性的状态标志:
|
|
UNIX实用程序
下面介绍了几个有用的UNIX文本处理过滤器类,带有选定的参数:
按内容处理:
sort | Sorts lines of text |
---|---|
-f | Ignore case |
-n | Numeric comparison |
-r | Reverse result order |
-k | Field key (start,stop or first)
-u | Unique lines with identical keys
-b | Ignore leading blanks
-s | Stable sort
-t | Specify field separator
uniq | Removes repeated lines
-c | Count occurrences
-i | Ignore case
-f | Ignore first n fields
-s | Ignore first n characters
-d | Only output repeated lines
-u | Only output non-repeated lines
grep | Matches patterns using regular expressions
-i | Ignore case
-v | Invert search
-w | Search expression as a word
-x | Search expression as whole line
-e | Specify individual pattern
-c | Only count number of matches
-n | Print line numbers
常用表达:
|
|
修改内容:
|
|
格式内容:
列按内容宽度对齐列
|
|
expand将列对齐到指定位置
|
|
fold以特定宽度包裹线条
|
|
按位置筛选:
cut删除部分线条
|
|
head打印第一行
|
|
tail打印最后一行
|
|
杂:
wc计算单词,行或字符
|
|
xargs构造参数
|
|
文件压缩:
tar存档文件
|
|
gzip压缩文件
|
|
解压缩.zip存档
|
|
gzcat解压缩.gz归档和管道到stdout
目录和文件导航:
cd更改目录
|
|
ls列出文件名
|
|
pwd打印工作目录路径
通过键入“man”后跟命令名称,可以获得包含详细说明和示例的其他文档。
终端键盘快捷键
可以在终端会话中使用控制和转义序列来浏览命令历史记录并移动光标以编辑当前输入的命令:
命令历史:
Ctrl-n 下一个命令
Ctrl-p 上一个命令
向前移动光标:
Ctrl-e 到行尾
Ctrl-f 由一个字符组成
Esc-f 一个论点
向后移动光标:
Ctrl-a 到行首
Ctrl-b 一个字符
Esc-b 一个论点
删除:
Esc-Del以前的论点上一个角色
Ctrl-d 下一个字符
Ctrl-k 到行尾
Ctrl-u 整行
Ctrl-w 上一个单词
Esc-Del 以前的论点
Esc-d 下一个参数
自动完成:
Tab 选项卡完成目录或文件名
程序控制:
Ctrl-c 退出正在运行的程序
^x^y 运行最后一个命令将x替换为y
(注意,通过按住Control,按下另一个键并释放Control来键入控制序列,同时通过按Escape然后按另一个键来键入Escape序列。)